LIO-SAM 기반 SLAM 기술의 비교 및 계보
1. LiDAR-Inertial SLAM의 발전과 LIO-SAM
자율 이동 로봇 및 자율 주행 시스템의 핵심 기술인 동시적 위치 추정 및 지도 작성(Simultaneous Localization and Mapping, SLAM)은 지난 수십 년간 비약적인 발전을 거듭해왔다. 초기 SLAM 연구는 주로 단일 센서, 특히 카메라나 LiDAR(Light Detection and Ranging)에 의존하였으나, 각 센서가 지닌 본질적인 한계는 복잡하고 동적인 실제 환경에서의 강인성 확보에 걸림돌이 되었다.1 시각 기반 SLAM은 조명 변화에 민감하고, 질감이 부족한 환경에서는 특징점 추출에 실패하여 정확도가 급격히 저하되는 문제를 안고 있다.1 반면, LiDAR 기반 SLAM은 레이저를 사용하여 주변 환경의 3차원 구조를 정밀하게 측정하므로 조명 변화에 강인하고, 장거리에서도 상세한 환경 정보를 획득할 수 있다.2 그러나 LiDAR 센서 역시 기하학적 특징이 부족한 긴 복도나 넓은 개활지와 같은 환경에서는 퇴화(degeneracy) 문제로 인해 드리프트가 누적되기 쉬우며, 센서 자체의 움직임으로 인해 포인트 클라우드에 왜곡(motion distortion)이 발생하는 문제가 존재한다.2
이러한 단일 센서의 한계를 극복하기 위한 방안으로 다중 센서 융합(multi-sensor fusion) 기술이 부상하였으며, 그중에서도 LiDAR와 관성 측정 장치(Inertial Measurement Unit, IMU)를 결합한 LiDAR-Inertial Odometry (LIO)가 현대 SLAM 기술의 주류로 자리 잡았다.5 IMU는 가속도계와 자이로스코프로 구성되어 고주파(high-frequency)로 플랫폼의 각속도와 가속도를 측정한다. 이 고주파 모션 데이터는 LiDAR 스캔이 진행되는 동안 발생하는 움직임 왜곡을 정밀하게 보정하고, 프레임 간의 상대적인 움직임에 대한 강력한 사전 정보(prior)를 제공하여 LiDAR의 퇴화 문제를 완화하는 상호 보완적인 역할을 수행한다.2
이러한 LIO 기술의 발전 과정에서 2020년 Tixiao Shan 등에 의해 발표된 LIO-SAM (Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping)은 하나의 이정표를 제시했다.3 LIO-SAM은 필터 기반의 접근법이 주를 이루던 시기에 팩터 그래프(factor graph)를 이용한 최적화 기반의 프레임워크를 제안하며, LiDAR, IMU, 그리고 선택적으로 GPS(Global Positioning System) 데이터를 강결합(tightly-coupled) 방식으로 융합하는 새로운 패러다임을 선보였다.2 이전의 대표적인 LiDAR SLAM인 LOAM(LiDAR Odometry and Mapping)은 전역 맵(global map)을 유지하며 스캔을 정합하는 방식으로 인해 시간이 지남에 따라 계산량이 증가하고, 루프 폐쇄(loop closure)나 GPS와 같은 비순차적(non-sequential)인 외부 제약을 통합하기 어려운 구조적 한계를 지니고 있었다.2 LIO-SAM은 팩터 그래프를 통해 이러한 문제들을 해결했다. 팩터 그래프는 로봇의 전체 궤적에 걸친 상태 변수들과 센서 측정값으로부터 파생된 제약(constraint)들을 하나의 거대한 그래프로 표현하여 전역적인 최적화를 가능하게 한다. 이 유연한 구조 덕분에 IMU 사전 적분(preintegration), LiDAR 오도메트리, GPS, 루프 폐쇄 등 다양한 종류의 정보를 독립적인 ’팩터’로 손쉽게 추가할 수 있게 되었다.2 이는 단순히 성능을 개선한 것을 넘어, SLAM 문제를 보다 체계적이고 확장 가능한 방식으로 모델링할 수 있는 기틀을 마련한 것으로 평가받는다.
본 안내서는 이처럼 LIO 기술 발전에 중추적인 역할을 한 LIO-SAM을 기준점으로 삼아, 이후 LIO-SAM의 아키텍처를 계승하여 기능을 확장하거나 특정 한계를 개선하기 위해 파생된 다양한 SLAM 기술들을 심층적으로 비교 고찰하고자 한다. 분석 대상은 LIO-SAM을 포함하여 LVI-SAM, RF-LIO, ID-LIO, LIO-CSI, LB-LIOSAM, Dynamic-LIO, LIO-SAM++와 같이 LIO-SAM의 계보를 잇는 기술들과, 이와는 다른 철학적 기반을 가진 Direct LIO 기술이다. 각 기술의 핵심 아이디어, 시스템 아키텍처, 그리고 수학적 원리를 상세히 분석함으로써 LiDAR-Inertial SLAM 기술의 진화 계보와 최신 연구 동향을 조망하는 것을 목표로 한다.
2. LIO-SAM 계열 SLAM 기술 계보도
LIO-SAM의 등장은 이후 수많은 파생 연구의 기폭제가 되었다. LIO-SAM의 강력하고 유연한 팩터 그래프 프레임워크는 다양한 기능 확장과 개선을 위한 이상적인 플랫폼을 제공했다. 아래의 계보도는 본 안내서에서 다루는 9가지 SLAM 기술 간의 발전 관계를 시각적으로 표현한 것이다. LIO-SAM을 기점으로, 각 기술이 어떤 문제를 해결하기 위해 분화되었는지를 명확히 보여준다. 계보도는 크게 LIO-SAM과 동일한 특징점 기반(Feature-Based) 방식을 따르는 그룹과, 근본적으로 다른 접근법을 취하는 직접 방식(Direct) 그룹으로 나뉜다.
graph LR
subgraph LIO SLAM Genealogy
A["LIO-SAM (2020.11)"] --> B("LVI-SAM (2021.09)");
A --> C("LIO-SAM++ (Enhancement)");
A -- Inspired/Compared --> D("Direct-LIO (2022.03)");
A -- Inspired/Compared --> E("RF-LIO (2023.01)");
A -- Inspired/Compared --> F("ID-LIO (2023.03)");
A -- Inspired/Compared --> G("Dynamic-LIO (2023.05)");
A -- Inspired/Compared --> H("LIO-CSI (2023.05)");
A -- Inspired/Compared --> I("LB-LIOSAM");
end
linkStyle 0,1,2 stroke-width:2px,stroke:blue
각 기술의 공식 발표 연도는 다음과 같으며, 이는 기술 발전의 연대기를 파악하는 데 중요한 기준이 된다.
- LIO-SAM: 2020년 3
- LVI-SAM: 2021년 6
- LIO-CSI: 2021년 9
- Direct LIO (DLIO/DLIOM): DLIO는 2022년, DLIOM은 2023년에 발표되었다.4
- RF-LIO: 2022년 11
- ID-LIO: 2023년 13
- LIO-SAM++: 2024년 15
- LB-LIOSAM: 2025년 17
- Dynamic-LIO: 2025년 18
이 계보도를 통해 LIO-SAM 발표 이후, 2021년에는 시각 정보를 융합(LVI-SAM)하거나 의미론적 정보를 활용(LIO-CSI)하는 방향으로, 2022년부터는 동적 환경에 대응(RF-LIO, ID-LIO)하거나 특징 연관 및 루프 폐쇄를 고도화(LIO-SAM++, LB-LIOSAM)하는 방향으로 연구가 활발히 진행되었음을 알 수 있다. Direct LIO는 이러한 흐름과 별개로, 특징점 추출 자체의 한계를 극복하려는 시도로서 독자적인 연구 분야를 형성하고 있다.
3. 기반 프레임워크: LIO-SAM 심층 분석
LIO-SAM은 현대 LIO 시스템의 구조적 토대를 마련한 프레임워크로서, 그 아키텍처와 최적화 방식을 이해하는 것은 파생 기술들을 분석하기 위한 필수적인 선행 과정이다. LIO-SAM의 핵심은 강결합 방식의 센서 융합을 효율적으로 수행하기 위해 설계된 독창적인 팩터 그래프 최적화 전략에 있다.
3.1 아키텍처 개요
LIO-SAM은 실시간 성능과 전역 일관성을 동시에 달성하기 위해 두 개의 독립적인 팩터 그래프를 유지하는 독특한 구조를 채택했다.19
- 고주파 오도메트리 팩터 그래프: 이 그래프는
imuPreintegration.cpp모듈에서 관리되며, IMU 사전 적분 팩터와 LiDAR 오도메트리 팩터를 최적화한다. 주된 목적은 실시간으로 IMU 바이어스를 추정하고, IMU 주파수(예: 500Hz)에 맞춰 고주파의 오도메트리 추정치를 제공하는 것이다. 이 그래프는 주기적으로 리셋되어 계산 복잡도가 누적되는 것을 방지한다.19 - 전역 최적화 팩터 그래프: 이 그래프는
mapOptimization.cpp모듈에서 관리되며, 시스템의 전체 생애주기 동안 유지된다. 여기에는 LiDAR 오도메트리 팩터, GPS 팩터, 그리고 루프 폐쇄 팩터가 포함된다. 이 그래프는 전역적인 궤적의 일관성을 보장하고 누적된 드리프트를 보정하는 역할을 담당한다.2
LIO-SAM의 실시간 성능을 뒷받침하는 또 다른 핵심 전략은 전역 맵과의 직접적인 스캔 매칭을 피하는 것이다. 이전의 SLAM 시스템들은 새로운 스캔을 거대한 전역 맵과 정합해야 했기 때문에, 맵의 크기가 커질수록 대응점 탐색(correspondence search) 시간이 기하급수적으로 증가하는 확장성(scalability) 문제를 겪었다. LIO-SAM은 이 문제를 ‘지역적 슬라이딩 윈도우(local sliding window)’ 접근법으로 해결했다.2 새로운 키프레임은 전체 맵이 아닌, 고정된 크기의 이전 ‘서브 키프레임(sub-keyframes)’ 집합으로 구성된 지역 맵(local map)에만 정합된다. 이 방식은 프론트엔드 스캔 매칭의 계산 시간을 궤적의 길이나 맵의 크기와 무관하게 일정하게 유지시켜준다. 이 지역적 정합의 결과로 얻어진 상대 변환(relative transformation)만이 전역 최적화 팩터 그래프에 하나의 제약 조건으로 추가된다. 이처럼 계산 비용이 높은 스캔 매칭은 지역적으로 한정하고, 전역 일관성 유지는 저비용의 팩터 그래프 최적화를 통해 수행하는 역할 분담 구조가 LIO-SAM의 실시간 성능을 가능하게 한 핵심적인 설계 철학이다.
3.2 핵심 팩터 분석
LIO-SAM의 팩터 그래프는 네 가지 종류의 팩터(제약 조건)로 구성되며, 이들의 조합을 통해 강인하고 정확한 상태 추정이 이루어진다.2
- IMU Preintegration Factor: 두 키프레임 사이의 시간 간격 동안 수집된 IMU 측정값(각속도, 가속도)을 사전 적분(pre-integration)하여 두 키프레임 간의 상대적인 자세, 속도, 위치 변화에 대한 제약을 생성한다. 이 팩터는 두 가지 핵심적인 역할을 수행한다. 첫째, LiDAR 포인트 클라우드의 움직임 왜곡을 보정하는 데 사용될 고주파 모션 정보를 제공한다. 둘째, LiDAR 오도메트리 최적화 과정에서 필요한 초기 추정값(initial guess)을 제공하여 최적화가 더 빠르고 정확하게 수렴하도록 돕는다.2
- LiDAR Odometry Factor: 새로운 키프레임이 생성되면, 해당 프레임의 포인트 클라우드에서 평면(planar) 특징점과 모서리(edge) 특징점을 추출한다. 이 특징점들을 앞서 언급한 지역 맵(local map)과 정합(scan-to-map matching)하여 두 키프레임 간의 상대 변환을 계산한다. 이 상대 변환이 LiDAR 오도메트리 팩터로서 팩터 그래프에 추가되어 두 키프레임의 상태 변수를 연결하는 제약 조건이 된다.2
- GPS Factor: GPS 수신이 가능한 환경에서는 GPS 측정값을 절대 위치에 대한 제약 조건으로 팩터 그래프에 추가할 수 있다. GPS 팩터는 특히 장시간 또는 대규모 환경에서 주행할 때 필연적으로 발생하는 저주파의 드리프트를 효과적으로 억제하는 역할을 한다. LIO-SAM은 GPS 신호가 수신될 때마다 해당 위치의 상태 변수에 직접적인 제약을 추가하여 전역 궤적을 보정한다.2
- Loop Closure Factor: 로봇이 이전에 방문했던 장소를 다시 지나가게 될 경우, 이를 인식하여 루프 폐쇄를 수행한다. LIO-SAM은 현재 키프레임의 위치를 기준으로 유클리드 거리상 가까운 과거의 키프레임들을 탐색한다. 후보가 발견되면 현재 키프레임과 과거 키프레임 주변의 서브맵 간에 스캔 매칭을 수행하여 정밀한 상대 변환을 계산한다. 이 상대 변환이 루프 폐쇄 팩터로 팩터 그래프에 추가되면, 그래프 전체에 걸쳐 최적화가 수행되면서 누적된 오차가 전역적으로 분배되고 수정된다.2
3.3 수학적 공식: 팩터 그래프 최적화 문제
LIO-SAM의 상태 추정 문제는 본질적으로 최대 사후 확률(Maximum a Posteriori, MAP) 추정 문제로 귀결된다. 모든 센서 측정값이 가우시안 노이즈를 따른다고 가정하면, 이 MAP 문제는 비선형 최소 제곱(nonlinear least-squares) 문제와 동일해진다.2 팩터 그래프는 이 비선형 최소 제곱 문제를 직관적으로 표현하는 도구이다. LIO-SAM 논문 자체에서 전체 비용 함수를 하나의 통합된 수식으로 명시적으로 제시하지는 않지만, 그 구조는 각 팩터에서 발생하는 잔차(residual)의 제곱합을 최소화하는 형태로 이해할 수 있다.3
전체 최적화 문제는 다음과 같이 개념적으로 표현할 수 있다.
\min_{\mathcal{X}} \left\{ \sum_{i \in \mathcal{I}} \left\| r_{\text{IMU}}(\hat{\mathbf{z}}_{i, i+1}, \mathcal{X}) \right\|_{\Sigma_{\text{IMU}}}^2 + \sum_{j \in \mathcal{L}} \left\| r_{\text{Lidar}}(\hat{\mathbf{z}}_{j, j+1}, \mathcal{X}) \right\|_{\Sigma_{\text{Lidar}}}^2 + \sum_{k \in \mathcal{G}} \left\| r_{\text{GPS}}(\hat{\mathbf{z}}_k, \mathcal{X}) \right\|_{\Sigma_{\text{GPS}}}^2 + \sum_{l \in \mathcal{C}} \left\| r_{\text{Loop}}(\hat{\mathbf{z}}_{l_1, l_2}, \mathcal{X}) \right\|_{\Sigma_{\text{Loop}}}^2 \right\}
- \mathcal{X}는 최적화하고자 하는 모든 상태 변수(로봇의 자세, 속도, IMU 바이어스 등)의 집합이다.
- r(\cdot)는 각 팩터(IMU, LiDAR, GPS, Loop Closure)에 대한 잔차 함수(residual function)를 나타낸다. 잔차는 센서 측정값(\hat{\mathbf{z}})과 현재 추정된 상태 변수 \mathcal{X}로부터 예측된 값 사이의 오차를 의미한다.
- \| \cdot \|_{\Sigma}^2는 마할라노비스 거리(Mahalanobis distance)의 제곱을 의미하며, \mathbf{r}^T \Sigma^{-1} \mathbf{r}와 같다. 여기서 \Sigma는 각 센서 측정의 불확실성을 나타내는 공분산 행렬(covariance matrix)이다.
특히 LiDAR 오도메트리 팩터의 잔차 r_{\text{Lidar}}는 LOAM에서 제안된 방식과 유사하게, 모서리 특징점과 지역 맵의 해당 선(line) 사이의 거리, 그리고 평면 특징점과 지역 맵의 해당 평면(plane) 사이의 거리 합으로 구성된다.3
모서리 특징점 k에 대한 점-선(point-to-line) 거리 잔차 d_{e_k}는 다음과 같다.
d_{e_k} = \frac{\vert (\mathbf{p}_{i+1,k}^e - \mathbf{p}_{i,u}^e) \times (\mathbf{p}_{i+1,k}^e - \mathbf{p}_{i,v}^e) \vert}{\vert \mathbf{p}_{i,u}^e - \mathbf{p}_{i,v}^e \vert}
평면 특징점 k에 대한 점-평면(point-to-plane) 거리 잔차 d_{p_k}는 다음과 같다.
d_{p_k} = \frac{\vert (\mathbf{p}_{i+1,k}^p - \mathbf{p}_{i,u}^p) \cdot ((\mathbf{p}_{i,u}^p - \mathbf{p}_{i,v}^p) \times (\mathbf{p}_{i,u}^p - \mathbf{p}_{i,w}^p)) \vert}{\vert (\mathbf{p}_{i,u}^p - \mathbf{p}_{i,v}^p) \times (\mathbf{p}_{i,u}^p - \mathbf{p}_{i,w}^p) \vert}
여기서 \mathbf{p}_{i+1,k}는 현재 키프레임 i+1의 특징점이고, \mathbf{p}_{i,u}, \mathbf{p}_{i,v}, \mathbf{p}_{i,w}는 지역 맵에서 찾은 대응점들이다. LIO-SAM은 이러한 잔차들의 합을 최소화하는 상대 변환을 찾고, 이를 팩터로 그래프에 추가한다. 이 최적화 과정은 iSAM2(incremental Smoothing and Mapping)와 같은 효율적인 증분 최적화(incremental optimization) 기법을 사용하여 실시간으로 수행된다.14
4. 기능 확장을 통한 강인성 향상
LIO-SAM이 제공하는 견고한 기하학적 SLAM 프레임워크는 그 자체로도 우수하지만, 실제 환경의 복잡성은 순수한 기하학 정보만으로는 해결하기 어려운 도전 과제들을 제시한다. 예를 들어, 기하학적 특징이 거의 없는 환경(예: 긴 터널, 넓은 평야)에서는 LiDAR 오도메트리가 실패할 수 있으며, 외관상으로는 비슷하지만 실제로는 다른 장소(예: 동일한 구조의 복도가 반복되는 건물)에서는 루프 폐쇄에 실패하여 맵이 왜곡될 수 있다. 이러한 문제에 대응하기 위해 LIO-SAM의 후속 연구들은 새로운 센서 정보를 융합하거나, 기존의 정보 처리 방식을 고도화하는 방향으로 진화했다. 이는 SLAM 기술이 단순한 기하학적 재구성을 넘어, 보다 풍부하고 다층적인 환경 정보를 이해하는 방향으로 나아가고 있음을 보여준다.
4.1 다중 센서 융합: LVI-SAM
LVI-SAM (Lidar-Visual-Inertial Odometry via Smoothing and Mapping)은 LIO-SAM의 한계를 극복하기 위한 가장 직관적인 해법, 즉 또 다른 강력한 센서인 카메라를 추가하는 방식을 채택했다.7 LVI-SAM의 핵심 철학은 LiDAR, 카메라, IMU라는 세 가지 이종(heterogeneous) 센서가 제공하는 상호 보완적인 정보를 강결합 방식으로 융합하여, 어떤 단일 센서 시스템도 달성할 수 없는 수준의 강인성과 정확성을 확보하는 것이다. 이는 LIO-SAM과 대표적인 시각-관성 SLAM인 VINS-Mono의 장점을 시스템 레벨에서 체계적으로 통합한 결과물이다.8
LVI-SAM의 아키텍처는 크게 두 개의 하위 시스템, 즉 LiDAR-관성 시스템(Lidar-Inertial System, LIS)과 시각-관성 시스템(Visual-Inertial System, VIS)으로 구성된다.7 이 두 시스템은 단순히 병렬적으로 작동하는 것이 아니라, 서로의 추정 결과를 긴밀하게 주고받으며 시너지를 창출한다.22
- LIS가 VIS를 보조하는 방식: VIS가 처음 시작될 때 필요한 초기화 과정은 매우 까다롭고 움직임이 충분해야 하는 등 제약 조건이 많다. LVI-SAM에서는 이미 안정적으로 작동 중인 LIS의 상태 추정치를 VIS의 초기값으로 제공하여, VIS가 빠르고 안정적으로 초기화를 완료할 수 있도록 돕는다.22 또한, VIS가 이미지에서 추출한 시각 특징점들은 2D 픽셀 좌표만을 가지므로 깊이(depth) 정보가 없다. LVI-SAM은 동기화된 LiDAR 포인트 클라우드를 이미지에 투영하여 각 시각 특징점에 해당하는 3D 깊이 정보를 부여한다. 이 3D 정보는 VIO(Visual-Inertial Odometry)의 정확도를 획기적으로 향상시킨다.7
- VIS가 LIS를 보조하는 방식: 반대로, LIS가 스캔 매칭을 수행할 때 필요한 초기 추정값은 VIS가 제공하는 고주파의 부드러운 궤적 추정치를 통해 더욱 정교해진다. 이는 LIS의 최적화 과정이 더 빠르게 수렴하고 지역 최솟값(local minima)에 빠질 위험을 줄여준다.22 특히 루프 폐쇄 과정에서 이러한 협력은 빛을 발한다. 카메라는 외관(appearance) 정보를 담고 있어 장소 인식(place recognition)에 매우 효과적이다. LVI-SAM에서는 VIS가 먼저 이미지 기반으로 루프 폐쇄 후보를 빠르고 효율적으로 찾아낸다. 그 후, LIS가 해당 후보 위치에서 정밀한 LiDAR 스캔 매칭을 수행하여 루프 폐쇄의 정확도를 최종적으로 검증하고 최적화한다. 이 계층적 접근법은 계산 효율성과 정확성을 모두 잡는 효과적인 전략이다.7
이러한 상호 보완적 설계 덕분에 LVI-SAM은 극한의 환경에서도 강인함을 유지한다. 예를 들어, 텍스처가 전혀 없는 하얀 벽으로 둘러싸인 환경에서는 VIS가 실패하지만 LIS는 정상적으로 작동할 수 있다. 반대로, 기하학적 특징이 없는 넓고 평평한 개활지에서는 LIS가 퇴화하지만, 멀리 있는 건물이나 나무 등의 시각적 특징을 이용하는 VIS는 안정적으로 작동할 수 있다. LVI-SAM은 이처럼 한쪽 시스템의 실패를 다른 쪽이 보완하는 고장 감내(fault-tolerant) 아키텍처를 통해 전체 시스템의 작동 범위를 크게 확장시켰다.7
4.2 루프 폐쇄 및 특징 연관 고도화: LB-LIOSAM & LIO-SAM++
LIO-SAM의 또 다른 한계는 대규모 환경이나 특징이 반복되는 환경에서 발생한다. LIO-SAM의 기본적인 루프 폐쇄는 유클리드 거리 기반으로 후보를 탐색하므로, 외관상 유사하지만 다른 장소(perceptual aliasing)를 잘못된 루프로 인식할 위험이 있다. 또한, 프론트엔드에서의 특징 연관(feature association)이 잘못될 경우, 이는 즉시 오도메트리 오차로 이어지고 결국 전체 궤적의 드리프트를 유발한다. LB-LIOSAM과 LIO-SAM++는 이러한 백엔드와 프론트엔드의 핵심 문제를 각각 정교하게 개선하는 데 초점을 맞춘다.
4.2.1 LB-LIOSAM: 강인한 루프 폐쇄를 통한 누적 오차 감소
LB-LIOSAM은 특히 대규모 환경에서 LIO-SAM이 겪는 누적 오차 문제 해결을 목표로, 프론트엔드의 특징 추출과 백엔드의 루프 폐쇄 모듈을 모두 강화한 시스템이다.24
- 프론트엔드 개선 (LinK3D): LB-LIOSAM은 LIO-SAM의 기본 특징 추출기 대신 LinK3D (Linear Keypoints Representation for 3D LiDAR Point Cloud) 알고리즘을 통합했다.17 LinK3D는 더 강인하고 반복 가능한 특징점을 추출하여 오도메트리 추정의 정확도를 초기 단계부터 향상시킨다.
- 백엔드 혁신 (BoW3D): LB-LIOSAM의 핵심적인 기여는 백엔드의 루프 폐쇄 모듈을 BoW3D (Bag of Words for Real-Time Loop Closing in 3D LiDAR SLAM)로 대체한 것이다.17 BoW3D는 포인트 클라우드로부터 시점 불변적인(viewpoint-invariant) 디스크립터(descriptor)를 생성하고, 이를 BoW(Bag-of-Words) 모델을 이용해 효율적으로 비교함으로써 장소 인식을 수행한다. 이는 단순히 좌표상의 거리만 비교하는 LIO-SAM의 방식보다 훨씬 더 강인하여, 시점이 약간 다르거나 환경에 작은 변화가 있더라도 동일한 장소를 안정적으로 인식할 수 있다. BoW3D를 통해 생성된 신뢰도 높은 루프 폐쇄 팩터는 기존의 IMU, GPS, LiDAR 오도메트리 팩터와 함께 전역 팩터 그래프에 추가되어 누적 오차를 효과적으로 보정한다.24
4.2.2 LIO-SAM++: 의미론과 기하학의 결합을 통한 연관 최적화
LIO-SAM++는 SLAM의 가장 근본적인 문제 중 하나인 ’데이터 연관(data association)’의 정확도를 높이는 데 집중한다.15 동적 객체나 폐색(occlusion)이 많은 복잡한 환경에서는 현재 스캔의 특징점을 이전 맵의 어떤 특징점과 연결해야 할지 결정하는 것이 매우 어렵다. LIO-SAM++는 이 문제를 해결하기 위해 기하학적 일관성과 의미론적 정보를 결합하는 정교한 접근법을 제안한다.
-
연관 최적화 (Association Optimization): LIO-SAM++는 기존의 최근접 이웃(nearest-neighbor) 검색 방식에 ‘지역 정규 벡터(local normal vector) 일관성’ 검사를 추가했다.15 특징점 매칭 후보를 찾은 후, 각 후보점 주변의 지역 표면 기하학(즉, 정규 벡터)이 현재 특징점 주변의 기하학과 일치하는지를 검사한다. 두 정규 벡터 간의 각도 차이가 특정 임계값을 초과하면, 이는 잘못된 매칭으로 간주하고 폐기한다. 이 필터링 과정은 비용 함수 최적화에 사용될 데이터의 품질을 사전에 높여, 최적화 결과의 신뢰도를 향상시킨다.
-
의미론적 제약 (Semantic Constraints): 더 나아가, LIO-SAM++는 의미론적 분할(semantic segmentation)을 통해 얻은 레이블 정보를 최적화 과정에 직접 통합한다.15 예를 들어, 현재 스캔의 ‘건물’ 특징점은 맵의 ‘건물’ 특징점과 매칭될 가능성이 높고, ‘자동차’ 특징점과는 매칭될 가능성이 낮다. 이러한 직관을 수학적으로 모델링하기 위해, LIO-SAM++는 기하학적 잔차(점-선/평면 거리)에 ’의미론적 일관성 가중치’를 곱하여 최종 비용 함수를 구성한다.
T^* = \arg \min_{T^*} \left\{ \sum_{f_{i,k}^e \in F_i^e} d_e \cdot W_{se} + \sum_{f_{i,k}^s \in F_i^s} d_s \cdot W_{se} \right\}
여기서 W_{se}는 현재 특징점의 의미론적 레이블과 매칭 후보점들의 의미론적 레이블 분포 간의 일치도를 나타내는 가중치다.15 만약 의미론적 일관성이 높으면
W_{se}는 1에 가까워지고, 낮으면 0에 가까워진다. 이 방식은 의미론적으로 일치하지 않는 매칭의 영향을 최적화 과정에서 자연스럽게 줄여준다.
- 적응형 키프레임 선택 (Adaptive Keyframe Selection): 마지막으로, LIO-SAM++는 프레임 간의 의미론적 변화량을 측정하여 키프레임을 선택하는 새로운 전략을 도입했다.15 환경에 의미 있는 변화가 발생했을 때만 키프레임을 생성함으로써, 불필요한 키프레임 생성을 줄이고 맵의 용량과 계산 효율성을 개선한다.
이러한 기능 확장의 흐름은 SLAM 기술이 직면한 문제들을 해결하기 위해 점차 더 높은 수준의 추상적 정보를 활용하는 방향으로 발전하고 있음을 명확히 보여준다. LVI-SAM이 시각이라는 새로운 감각을 추가했다면, LB-LIOSAM은 기하학적 정보를 더 정제된 디스크립터로 추상화했으며, LIO-SAM++와 LIO-CSI는 ’이것이 무엇인가’라는 의미론적 이해를 시스템에 부여했다. 이는 환경의 기하학적 구조만으로는 강인한 자율 주행을 달성하기에 불충분하며, 다중 모달리티와 의미론적 이해가 필수적이라는 공감대가 형성되고 있음을 시사한다.
5. 동적 환경 대응 전략 비교 분석
전통적인 SLAM 알고리즘들은 대부분 ’정적 세계 가정(static world assumption)’에 기반한다. 즉, 주변 환경의 모든 객체는 움직이지 않는다고 가정한다. 그러나 도심이나 실내와 같이 사람, 차량 등 움직이는 객체(dynamic objects)가 많은 실제 환경에서 이 가정은 쉽게 깨진다.11 동적 객체에서 반사된 LiDAR 포인트들은 정적 맵에 유령(ghost)처럼 잔상을 남겨 맵의 품질을 저하시키고, 오도메트리 추정 시 잘못된 제약 조건을 생성하여 궤적의 정확도를 심각하게 훼손한다.25 LIO-SAM을 기반으로 한 여러 연구들은 이 동적 환경 문제를 해결하기 위해 각기 다른 철학적 접근법을 제시했다. 이들의 전략은 ‘선제적으로 제거할 것인가’, ‘불확실성을 가지고 점진적으로 배제할 것인가’, ‘의미를 이해하여 필터링할 것인가’, 아니면 ’가벼운 휴리스틱으로 빠르게 처리할 것인가’의 스펙트럼으로 나눌 수 있다.
5.1 선제적 제거 접근법: RF-LIO
RF-LIO (Removal-First LIO)는 이름에서 알 수 있듯이, 동적 객체를 ’먼저 제거한다(Removal-First)’는 가장 공격적이고 직관적인 전략을 취한다.11 이 접근법의 핵심 철학은 오염된 데이터가 SLAM 시스템의 어떤 단계에도 유입되지 않도록 원천적으로 차단하는 것이다.
- 메커니즘: RF-LIO는 LIO-SAM의 프론트엔드에 동적 객체 탐지 및 제거 모듈을 추가했다. 이 모듈은 LiDAR 스캔을 적응형 다중 해상도 거리 이미지(adaptive multi-resolution range images)로 변환하여 현재 프레임과 이전 프레임 간의 차이를 분석함으로써 움직이는 부분을 식별한다.11 동적 객체로 판단된 포인트 클러스터는 스캔에서 완전히 제거된다. 그 후, 오직 정적인 포인트들로만 구성된 ‘정제된(sanitized)’ 스캔이 LIO-SAM의 후속 파이프라인(특징 추출, 스캔 매칭, 최적화)으로 전달된다.12
- 장점과 한계: 이 방식의 가장 큰 장점은 명확함과 잠재적인 고성능이다. 동적 객체가 완벽하게 제거된다면, 후속 SLAM 과정은 이상적인 정적 환경에서 작동하는 것과 같으므로 매우 높은 정확도를 달성할 수 있다. 실제로 RF-LIO는 매우 동적인 환경에서 LIO-SAM 대비 절대 궤적 오차(ATE)를 최대 70%까지 개선하는 성능을 보였다.11 그러나 이 전략의 성공은 전적으로 동적 객체 탐지 모듈의 성능에 달려 있다는 치명적인 약점이 있다. 만약 탐지 모듈이 정적인 벽의 일부를 동적 객체로 오인하여 제거(false positive)한다면, SLAM 시스템은 중요한 기하학적 정보를 잃게 된다. 반대로, 움직이는 차량을 정적 객체로 오인하여 통과(false negative)시킨다면, 시스템은 여전히 오염된 데이터로 인해 성능이 저하된다.
5.2 지연 제거 및 동적 가중치 부여: ID-LIO
ID-LIO (Indexed Point and Delayed Removal LIO)는 RF-LIO의 이진법적(binary) 결정 방식이 가진 위험성을 인지하고, 동적 객체 탐지의 불확실성을 보다 유연하게 다루는 실용적인 접근법을 제안한다.13 ID-LIO의 핵심 철학은 ’즉각적인 판단을 유보하고, 시간의 흐름에 따라 증거를 축적하여 점진적으로 신뢰도를 조정하는 것’이다.
- 메커니즘: ID-LIO는 두 가지 핵심적인 메커니즘을 도입했다.
-
인덱스 기반 동적 점 전파 (Indexed Point Propagation): 시스템은 맵의 각 특징점에 고유 인덱스를 부여하고, 해당 점이 동적 객체로 관측될 때마다 카운트(ndo, number of dynamic observations)를 증가시킨다.13 이 정보는 시간의 흐름에 따라 유지되고 전파되어, 특정 점이 얼마나 자주 동적으로 관측되었는지에 대한 ’역사’를 기록한다.
-
동적 가중치 최적화 (Dynamic Weights Optimization): 프론트엔드 최적화 과정에서, ID-LIO는 각 LiDAR 측정값의 잔차에 ’동적 가중치(w)’를 적용한다.13 이 가중치는 해당 특징점의 동적 관측 횟수 ndo에 반비례하도록 설계되었다.14
w = \begin{cases} 1 & \text{if } ndo \le 1 \\ \frac{1}{ndo} & \text{if } ndo \ge 2 \end{cases}
이 가중치가 적용된 LiDAR 측정 오차항 r_L(x_w^k) = \sum_i w_i d_e^i + \sum_j w_j d_p^j를 최소화한다.14 즉, 동적일 가능성이 높은( ndo가 큰) 특징점에서 발생한 오차는 최적화 과정에서 그 영향력이 줄어들고, 정적일 가능성이 높은( ndo가 작은) 특징점의 오차는 더 중요하게 다뤄진다.
- 장점: 이 ‘지연 제거(Delayed Removal)’ 전략은 동적 객체 탐지기의 일시적인 오류에 대해 훨씬 강인하다. 한두 번 잘못 탐지되더라도 해당 특징점이 즉시 제거되지 않고 단지 가중치만 약간 줄어들기 때문에, 시스템 전체의 안정성이 높아진다. 이 접근법은 높은 동적 환경에서 LIO-SAM 대비 ATE를 67%에서 85%까지 개선하는 뛰어난 성능을 입증했다.13
5.3 의미론적 정보를 활용한 필터링: LIO-CSI
LIO-CSI (LIO with loop Closure combined with Semantic Information)는 한 단계 더 나아가, ’이것이 무엇인지’를 이해하면 ‘이것이 어떻게 행동할지’ 예측할 수 있다는 지적인 접근법을 취한다.9 LIO-CSI는 딥러닝 기반의 의미론적 분할(semantic segmentation) 기술을 SLAM 파이프라인에 깊숙이 통합하여, 동적 객체 문제를 보다 근본적으로 해결하고자 한다.
- 메커니즘: LIO-CSI는 SPVNAS와 같은 딥러닝 네트워크를 사용하여 입력 포인트 클라우드의 모든 점에 의미론적 레이블(예: 도로, 건물, 식생, 차량, 보행자)을 부여한다.9 이 풍부한 의미론적 정보는 SLAM의 여러 단계에서 활용된다.
- 동적 객체 필터링: ‘차량’, ’보행자’와 같이 본질적으로 움직일 가능성이 높은 클래스로 분류된 포인트들은 프론트엔드 오도메트리 계산 이전에 명시적으로 필터링된다.9 이는 RF-LIO와 유사한 선제적 제거 방식이지만, 기하학적 변화가 아닌 객체의 ’의미’에 기반한다는 점에서 더 정교하다.
- 의미론적 보조 오도메트리 및 루프 폐쇄: 정적 객체로 분류된 포인트들만을 사용하여 오도메트리를 계산하더라도, 특징 매칭의 모호성은 여전히 존재한다. LIO-CSI는 특징 매칭 시 기하학적 유사성뿐만 아니라 의미론적 레이블의 일치 여부도 확인하여 매칭의 신뢰도를 높인다.9 또한, 루프 폐쇄 시에도 Scan Context와 같은 디스크립터에 의미론적 정보를 추가하여, 동적 객체로 인해 장소의 외관이 변하더라도 안정적으로 재방문 여부를 판단할 수 있게 한다.9
-
비용 함수 통합: 최적화 과정에서는 의미론적 일관성을 가중치 함수 \phi(*)로 모델링하여 잔차에 적용한다.9
\min \left\{ \sum \phi(L_i, L_j) \cdot d_e + \sum \phi(L_i, L_k) \cdot d_p \right\}
여기서 L_i, L_j, L_k는 특징점들의 의미론적 레이블이며, 레이블이 일치할수록 가중치 \phi는 1에 가까워진다. -
장점과 한계: 이 방식은 가장 높은 수준의 환경 이해를 바탕으로 하므로 잠재적으로 가장 강력한 성능을 낼 수 있다. 그러나 사전 훈련된 딥러닝 모델에 대한 의존성이 높다는 단점이 있다. 모델이 훈련 데이터에 없는 새로운 종류의 객체나 환경을 만나면 성능이 저하될 수 있으며(일반화 문제), 딥러닝 네트워크 추론에 상당한 계산 자원(주로 GPU)이 필요하다.
5.4 레이블 일관성 기반 접근법: Dynamic-LIO
Dynamic-LIO는 LIO-CSI와 같은 딥러닝 기반 접근법의 높은 계산 비용과 의존성 문제를 해결하면서도 효과적으로 동적 객체를 처리하려는 미니멀리즘적 접근법을 대표한다.18 Dynamic-LIO의 핵심 아이디어는 복잡한 모델 없이, 간단하고 계산적으로 저렴한 휴리스틱을 통해 동적 객체를 탐지하는 것이다.
- 메커니즘: Dynamic-LIO는 ’레이블 일관성(Label Consistency)’이라는 독창적인 개념을 기반으로 한다.27 이는 “동적 객체는 대부분 지면 위에 있으며, 이전에 관측된 정적 맵 구조와 일치하지 않는다“는 강력한 경험적 관찰에 착안한 것이다.
- 이진 레이블링: 먼저, 현재 들어온 LiDAR 스캔의 모든 포인트를 ’지면(ground)’과 ’비지면(non-ground)’이라는 두 가지 클래스로 매우 빠르게 분할한다. 이는 복잡한 의미론적 분할이 아닌, 기하학적 특징에 기반한 간단한 알고리즘으로 수행된다.27
- 일관성 검사: 그 후, 각 ‘비지면’ 포인트에 대해, 이전에 구축된 맵 상에서 가장 가까운 이웃 포인트들을 찾는다. 만약 현재 ‘비지면’ 포인트가 맵에서는 ’지면’으로 표시된 영역에 위치한다면, 이는 이전에 없던 객체가 나타났음을 의미하므로 동적 객체일 가능성이 매우 높다고 판단한다.
- 제거: 이러한 레이블 불일치(inconsistency)가 발견된 포인트들은 동적 객체로 간주하고 스캔에서 제거한다.
- 장점: 이 방식의 최대 장점은 극도로 낮은 계산 비용이다. 딥러닝 추론 과정이 전혀 없기 때문에, 단일 스캔 당 1~9ms라는 매우 짧은 시간 안에 동적 객체 탐지 및 제거를 완료할 수 있다.27 이는 자원이 제한된 임베디드 시스템에서도 실시간으로 동적 환경 SLAM을 수행할 수 있는 가능성을 열어준다. Dynamic-LIO는 SR-LIO와 SC-A-LOAM을 기반으로 구현되어 효율성을 극대화했다.18
이 네 가지 전략은 동적 환경 SLAM 문제에 대한 단일 최적해가 존재하지 않음을 보여준다. 각 전략은 확실성(RF-LIO), 강인성(ID-LIO), 지능(LIO-CSI), 효율성(Dynamic-LIO) 이라는 서로 다른 가치를 우선시하며, 이는 어플리케이션의 요구사항(예: 사용 가능한 컴퓨팅 파워, 환경의 동적성 수준, 실패 시의 위험 비용)에 따라 최적의 선택이 달라질 수 있음을 시사한다.
6. 대안적 접근법: Direct LIO
지금까지 논의된 LIO-SAM 및 그 파생 기술들은 모두 ’특징점 기반(feature-based)’이라는 공통된 철학을 공유한다. 이 방식은 수만에서 수십만 개에 이르는 원시 포인트 클라우드에서 모서리(edge)나 평면(plane)과 같은 소수의 핵심적인 기하학적 특징점들을 추출하고, 이들 간의 대응 관계를 찾아 최적화하는 전략이다. 이는 정보의 대부분을 의도적으로 버리는 대신, 계산의 효율성을 얻는 접근법이다.4 그러나 이 방식은 근본적인 한계를 내포하고 있다. 만약 환경 자체가 뚜렷한 기하학적 특징을 가지고 있지 않다면(예: 숲, 초원, 눈 덮인 지형 등 비구조적인(unstructured) 환경), 특징점 추출 자체가 실패하거나 신뢰할 수 없는 특징점들만 추출되어 SLAM 시스템 전체가 실패로 이어질 수 있다.
Direct LIO (DLIO/DLIOM)는 바로 이 문제에 대한 대안적 해법을 제시한다.4 ‘직접(Direct)’ 방식의 핵심 철학은 “정보를 버리지 말고, 있는 그대로 모두 사용하자“는 것이다. 즉, 특징점 추출이라는 중간 단계를 완전히 생략하고, 전처리(preprocessing)를 최소화한 원시 포인트 클라우드 전체 또는 대부분을 직접 정합(registration)하여 상대적인 움직임을 추정한다.4 이 방식은 특징점 기반 방식의 정보 손실 문제를 원천적으로 해결하지만, 대신 방대한 양의 데이터를 실시간으로 처리해야 하는 새로운 계산적 도전 과제에 직면하게 된다.
6.1 핵심 기술
Direct LIO는 대량의 포인트를 효율적이고 정확하게 처리하기 위해 다음과 같은 핵심 기술들을 사용한다.
- GICP (Generalized-ICP): 전통적인 ICP(Iterative Closest Point) 알고리즘은 단순히 가장 가까운 점(point-to-point) 사이의 거리를 최소화하기 때문에, 포인트 클라우드의 국소적인 표면 구조를 고려하지 못하는 한계가 있다. GICP는 각 포인트 주변의 분포를 공분산 행렬(covariance matrix)로 모델링하고, 두 포인트 클라우드의 확률 분포 간의 거리를 최소화하는 방식으로 정합을 수행한다. 이는 실질적으로 점-평면(point-to-plane) 정합과 유사한 효과를 내어, 더 적은 반복으로 더 정확한 정합 결과를 얻을 수 있게 한다. DLIOM은 이 GICP 비용 함수를 스캔-맵(scan-to-map) 정합의 기본 최적화 문제로 사용한다.4
- 연속 시간 움직임 보정 (Continuous-Time Motion Correction): Direct 방식은 모든 포인트를 사용하기 때문에 LiDAR 스캔이 진행되는 동안 발생하는 움직임 왜곡(motion distortion)에 더욱 민감하다. 이를 정밀하게 보정하기 위해, Direct LIO는 IMU 측정값을 사용하여 스캔 내의 모든 포인트에 대해 각기 다른 시점의 변환을 계산하는 연속 시간 궤적 추정 기법을 사용한다. 특히 DLIO와 DLIOM은 기존의 단순한 등속도(constant velocity) 가정을 넘어, 등가속도, 등저크(constant jerk) 및 등각가속도(constant angular acceleration) 모델을 사용하여 훨씬 더 부드럽고 물리적으로 타당한 궤적을 추정한다.4 이 고차원 모션 모델은 특히 급격한 움직임이 발생하는 상황에서 왜곡을 효과적으로 보정하여 정합의 정확도를 크게 향상시킨다.
6.2 수학적 공식
Direct LIO의 핵심 아이디어는 그 수학적 공식에 잘 나타나 있다.
-
GICP 비용 함수 (DLIOM): DLIOM에서 스캔-맵 정합은 현재 스캔 포인트 클라우드 \hat{\mathbf{P}}^W_k와 지역 서브맵 \hat{\mathbf{S}}^W_k 간의 GICP 잔차 오차 E를 최소화하는 변환 \Delta \mathbf{T}_k를 찾는 비선형 최적화 문제로 정의된다.4
E(\Delta \mathbf{T}_k \hat{\mathbf{P}}^W_k, \hat{\mathbf{S}}^W_k) = \sum_{c \in C} \mathbf{d}_c^T (\mathbf{C}^S_{k,c} + \Delta \mathbf{T}_k \mathbf{C}^P_{k,c} \Delta \mathbf{T}_k^T)^{-1} \mathbf{d}_c
여기서 \mathbf{d}_c = \mathbf{s}^c_k - \Delta \mathbf{T}_k \mathbf{p}^c_k는 대응점 쌍 (\mathbf{p}^c_k, \mathbf{s}^c_k) 간의 차이를 나타내고, \mathbf{C}^P_{k,c}와 \mathbf{C}^S_{k,c}는 각 포인트의 국소적 표면 구조를 나타내는 공분산 행렬이다. 이 비용 함수는 두 포인트 클라우드의 기하학적 구조가 가장 잘 일치하도록 하는 변환을 찾는다. -
연속 시간 움직임 보정 (DLIOM): 스캔 시작 시점부터 특정 포인트 p^n_k가 측정된 시점 t까지의 변환을 계산하기 위해, DLIOM은 IMU 측정값(\hat{\mathbf{a}}, \hat{\boldsymbol{\omega}})을 사용하여 시간 t에 대한 위치 \mathbf{p}^*(t)와 방향 \mathbf{q}^*(t)를 다음과 같은 분석적 해(analytical solution)로 구한다.4
\mathbf{p}^*(t) = \mathbf{p}_{i-1} + \mathbf{v}_{i-1}t + \frac{1}{2} R(\mathbf{q}_{i-1})\hat{\mathbf{a}}_{i-1}t^2 + \frac{1}{6} \mathbf{j}_i t^3
\mathbf{q}^*(t) = \mathbf{q}_{i-1} + \frac{1}{2} (\mathbf{q}_{i-1} \otimes \hat{\boldsymbol{\omega}}_{i-1})t + \frac{1}{4} (\mathbf{q}_{i-1} \otimes \hat{\boldsymbol{\alpha}}_i)t^2
여기서 i-1은 해당 포인트 측정 시점 직전의 IMU 측정 시점을 의미하며, \mathbf{j}_i와 \hat{\boldsymbol{\alpha}}_i는 각각 추정된 저크와 각가속도이다. 이 수식은 스캔 내의 모든 포인트에 대해 고유한 보정 변환을 빠르고 정밀하게 계산할 수 있게 해준다.
Direct LIO의 등장은 특징점 기반 SLAM이 지배하던 연구 지형에 중요한 대안을 제시했다. 이는 특징점 기반 방식의 근본적인 실패 시나리오에 대한 직접적인 해답으로서, SLAM 문제를 해결하는 데 있어 정보의 손실과 계산의 효율성 사이의 트레이드오프에 대한 새로운 관점을 제공한다. Direct LIO는 정보 손실 문제를 해결하는 대신, 계산 효율성과 정밀한 모션 모델링이라는 새로운 도전 과제를 제시하며 SLAM 기술의 또 다른 혁신 분기를 이끌고 있다.
7. 종합 비교 분석 및 결론
본 안내서에서 분석한 9가지 SLAM 기술들은 LIO-SAM이라는 공통의 뿌리에서 출발했거나, 그에 대한 대안으로 제시되면서 LiDAR-Inertial SLAM의 다양한 발전 가능성을 보여주었다. 각 기술은 특정 문제 상황을 해결하기 위해 독창적인 아이디어를 도입했으며, 이는 SLAM 설계에 있어 다양한 트레이드오프가 존재함을 시사한다. 이 섹션에서는 앞서 논의된 기술들을 핵심 성능 지표에 따라 종합적으로 비교하고, 기술 발전의 거시적인 흐름을 분석하며, 향후 연구 방향을 전망한다.
7.1 핵심 성능 지표 비교
아래 표는 분석된 9가지 SLAM 기술의 핵심적인 특징을 한눈에 비교할 수 있도록 정리한 것이다. 이 표는 각 기술의 철학적 기반, 주요 해결 과제, 그리고 기술적 특징을 요약하여 보여줌으로써, 특정 응용 분야에 적합한 알고리즘을 선택하는 데 유용한 가이드라인을 제공한다.
| 항목 (Item) | LIO-SAM | LVI-SAM | Direct LIO (DLIOM) | LB-LIOSAM | RF-LIO | ID-LIO | LIO-CSI | Dynamic-LIO | LIO-SAM++ |
|---|---|---|---|---|---|---|---|---|---|
| 발표 연도 | 2020 | 2021 | 2023 | 2025 | 2022 | 2023 | 2021 | 2025 | 2024 |
| 핵심 방식 | 특징점 기반 | 특징점 + 시각 | 직접 방식 | 특징점 기반 | 특징점 기반 | 특징점 기반 | 특징점 + 의미론 | 특징점 기반 | 특징점 + 의미론 |
| 기반 기술 | LOAM, iSAM2 | LIO-SAM, VINS-Mono | GICP | LIO-SAM | LIO-SAM | LIO-SAM | LIO-SAM, SPVNAS | SR-LIO, SC-A-LOAM | LIO-SAM |
| 동적 환경 처리 | 없음 | 없음 | 없음 | 없음 | 선제적 제거 | 지연 제거, 동적 가중치 | 의미론적 필터링 | 레이블 일관성 | 의미론적 필터링 |
| 루프 폐쇄 전략 | 거리 기반 | 시각 보조 | (별도 모듈) | BoW3D | 거리 기반 | 거리 기반 | 의미론적 Scan Context | Scan Context | 의미론적 제약 |
| 주요 기여 | 강결합 LIO 팩터 그래프 | LiDAR-Visual-Inertial 강결합 | 원시 포인트 직접 정합 | 강인한 특징/루프 폐쇄 | 동적 환경 강인성 | 불확실성 하 동적 처리 | 의미론 정보 융합 | 경량 동적 객체 제거 | 연관 최적화, 의미론 |
| 계산 복잡성/의존성 | 중간 | 높음 (카메라 추가) | 높음 (Dense data) | 중간 | 중간 (제거 오버헤드) | 중간 (추적 오버헤드) | 높음 (DL 모델 의존) | 낮음 | 높음 (DL 모델 의존) |
7.2 기술적 트레이드오프 심층 고찰
이 비교 분석을 통해 SLAM 기술 설계에 내재된 몇 가지 근본적인 트레이드오프를 확인할 수 있다.
- 정확도 vs. 실시간성: Direct LIO는 모든 포인트 정보를 활용하여 잠재적으로 가장 높은 정확도를 달성할 수 있지만, 방대한 데이터를 처리하기 위한 높은 계산 비용을 수반한다. 반면, LIO-SAM 계열은 특징점 추출을 통해 데이터의 양을 극적으로 줄여 실시간성을 확보하지만, 특징이 부족한 환경에서는 정보 손실로 인해 정확도가 저하될 수 있다. 이는 SLAM 시스템이 처리할 정보의 양과 주어진 시간 및 계산 자원 사이의 영원한 줄다리기를 보여준다.
- 강인성 vs. 의존성: LVI-SAM(카메라), LIO-CSI/LIO-SAM++(딥러닝 모델)는 추가적인 정보 소스를 도입하여 특정 실패 시나리오(예: 기하학적 퇴화, 동적 객체, 데이터 연관 실패)에 대한 강인성을 획기적으로 향상시킨다. 그러나 이러한 강인성은 추가 센서의 정밀한 캘리브레이션 및 동기화, 또는 높은 컴퓨팅 자원(GPU)과 사전 훈련된 모델에 대한 새로운 의존성을 대가로 한다. 반면, Dynamic-LIO와 같은 기술은 외부 의존성을 최소화하면서도 영리한 휴리스틱을 통해 강인성을 확보하려는 시도로, 시스템의 복잡성과 성능 사이의 균형점을 찾으려는 노력을 보여준다.
- 동적 환경 처리 전략의 스펙트럼: 동적 객체 처리 방식은 SLAM 시스템이 불확실성을 어떻게 다루는지를 보여주는 좋은 예이다. RF-LIO의 ‘공격적이고 확신에 찬 제거’ 방식은 탐지 성능이 좋을 때 최상의 결과를 내지만, 오류 발생 시 치명적일 수 있다. 반면, ID-LIO의 ‘점진적 불신’ 방식은 탐지 오류에 더 유연하게 대처할 수 있지만, 시스템의 복잡도가 증가한다. LIO-CSI의 ’지능적 이해 기반 필터링’은 가장 정교하지만, 그 지능의 원천인 딥러닝 모델의 일반화 성능에 전적으로 의존한다. 이처럼 다양한 전략의 존재는 단일 최적해가 없으며, 문제의 성격에 따라 다른 접근이 필요함을 시사한다.
7.3 결론 및 향후 전망
LIO-SAM은 그 자체로 완성도 높은 LIO 시스템일 뿐만 아니라, 강력하고 확장 가능한 팩터 그래프 아키텍처를 제공함으로써 이후 수많은 후속 연구가 탄생할 수 있는 ’플랫폼’으로서의 역할을 성공적으로 수행했다. 본 안내서에서 분석한 기술들은 LIO-SAM이라는 플랫폼 위에서 SLAM 기술이 직면한 다양한 도전 과제들을 해결하기 위해 어떻게 진화해왔는지를 명확하게 보여준다.
기술 발전의 흐름은 크게 두 가지 방향으로 요약할 수 있다. 첫 번째는 LVI-SAM, LIO-CSI에서 볼 수 있듯이, 더 많은 종류의 센서와 더 높은 수준의 정보(시각, 의미론)를 통합하여 시스템의 인지 능력을 확장하는 ’융합(Fusion)’의 방향이다. 두 번째는 Direct LIO, Dynamic-LIO처럼 특정 문제(정보 손실, 계산 효율성)를 더 근본적이고 효율적으로 해결하기 위해 새로운 알고리즘 패러다임을 탐구하는 ’전문화(Specialization)’의 방향이다.
향후 LiDAR-Inertial SLAM 연구는 다음과 같은 방향으로 더욱 발전할 것으로 전망된다.
- 장기적 강인성(Long-term Robustness): 현재의 SLAM 시스템들은 수 시간에서 수 일에 걸친 장기 운용 시 발생하는 외관 변화(계절, 날씨, 조명)나 맵의 노후화에 여전히 취약하다. 이를 해결하기 위해 맵을 지속적으로 업데이트하고 관리하는 맵의 생명주기 관리(map lifecycle management) 기술이 중요해질 것이다.
- 고수준 장면 이해(High-level Scene Understanding): 의미론적 정보를 넘어, 객체 간의 관계, 장소의 기능, 그리고 동적 객체의 행동 예측(behavior prediction)과 같은 더 높은 수준의 장면 이해를 SLAM 프레임워크에 통합하는 연구가 활발해질 것이다. 이는 로봇이 단순히 ’어디에 있는지’를 아는 것을 넘어, ’무엇을 할 수 있는지’를 판단하는 진정한 자율성을 향한 중요한 단계가 될 것이다.
- 효율성과 접근성: 알고리즘의 성능이 상향 평준화됨에 따라, 제한된 컴퓨팅 자원을 가진 저가형 하드웨어에서도 안정적으로 구동될 수 있는 경량화 및 최적화 기술의 중요성이 더욱 부각될 것이다.
결론적으로, LIO-SAM과 그 파생 기술들의 발전사는 SLAM이 정적인 기하학적 복원에서 시작하여, 동적이고 의미가 풍부한 실제 세계를 이해하고 상호작용하기 위한 복합적인 인지 시스템으로 진화하고 있음을 보여주는 압축적인 역사라 할 수 있다. 이러한 기술적 진보는 앞으로 다가올 자율 로봇과 자율 주행의 시대를 여는 핵심적인 원동력이 될 것이다.
8. 참고 자료
- LPVIMO-SAM: Tightly-coupled LiDAR/Polarization Vision/Inertial/Magnetometer/Optical Flow Odometry via Smoothing and Mapping - arXiv, https://arxiv.org/html/2504.20380v1
- Lio-sam: Tightly-coupled lidar inertial odometry via smoothing and mapping - arXiv, https://arxiv.org/pdf/2007.00258
- LIO-SAM: Tightly-coupled Lidar Inertial Odometry via Smoothing and …, https://arxiv.org/abs/2007.00258
- Direct LiDAR-Inertial Odometry and Mapping: Perceptive … - SciSpace, https://scispace.com/pdf/direct-lidar-inertial-odometry-and-mapping-perceptive-and-2tlxptwo.pdf
- LVI-Fusion: A Robust Lidar-Visual-Inertial SLAM Scheme - MDPI, https://www.mdpi.com/2072-4292/16/9/1524
- LIO-SAM: Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping, https://www.semanticscholar.org/paper/LIO-SAM%3A-Tightly-coupled-Lidar-Inertial-Odometry-Shan-Englot/e49902d212374c81b48d23c3cac1cee6e2339edd
- MIT Open Access Articles LVI-SAM: Tightly-coupled Lidar-Visual- Inertial Odometry via Smoothing and Mapping, https://dspace.mit.edu/bitstream/handle/1721.1/144047/2104.10831.pdf?sequence=2&isAllowed=y
- LVI-SAM: Tightly-coupled Lidar-Visual-Inertial Odometry via Smoothing and Mapping - GitHub, https://github.com/TixiaoShan/LVI-SAM
- LIO-CSI: LiDAR inertial odometry with loop closure combined with semantic information, https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0261053
- [PDF] Direct LiDAR-Inertial Odometry: Lightweight LIO with …, https://www.semanticscholar.org/paper/b4bbcacf6e04be281705c9a53d0c1e9329f97ed0
- [2206.09463] RF-LIO: Removal-First Tightly-coupled Lidar Inertial Odometry in High Dynamic Environments - arXiv, https://arxiv.org/abs/2206.09463
- RF-LIO: Removal-First Tightly-coupled Lidar Inertial Odometry in …, https://www.researchgate.net/publication/361457103_RF-LIO_Removal-First_Tightly-coupled_Lidar_Inertial_Odometry_in_High_Dynamic_Environments
- LiDAR Inertial Odometry Based on Indexed Point and Delayed Removal Strategy in Highly Dynamic Environments - MDPI, https://www.mdpi.com/1424-8220/23/11/5188
- (PDF) LiDAR Inertial Odometry Based on Indexed Point and …, https://www.researchgate.net/publication/370148950_LiDAR_Inertial_Odometry_Based_on_Indexed_Point_and_Delayed_Removal_Strategy_in_High_Dynamic_Environments
- LIO-SAM++: A Lidar-Inertial Semantic SLAM with Association … - MDPI, https://www.mdpi.com/1424-8220/24/23/7546
- Order Article Reprints - MDPI, https://www.mdpi.com/1424-8220/24/23/7546/reprints
- LB-LIOSAM: an improved mapping and localization method with loop - Ingenta Connect, https://www.ingentaconnect.com/content/10.1108/IR-07-2024-0314
- ZikangYuan/dynamic_lio: [IROS 2025] A LiDAR-inertial … - GitHub, https://github.com/ZikangYuan/dynamic_lio
- LIO-SAM: Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping - GitHub, https://github.com/TixiaoShan/LIO-SAM
- LiDAR Inertial Odometry Based on Indexed Point and Delayed Removal Strategy in High Dynamic Environments - Preprints.org, https://www.preprints.org/manuscript/202304.0527/v1
- Marked-LIEO: Visual Marker-Aided LiDAR/IMU/Encoder Integrated Odometry - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC9269198/
- LVI-SAM: Tightly-coupled Lidar-Visual-Inertial Odometry via Smoothing and Mapping - ar5iv, https://ar5iv.labs.arxiv.org/html/2104.10831
- (PDF) LVI-SAM: Tightly-coupled Lidar-Visual-Inertial Odometry via Smoothing and Mapping, https://www.researchgate.net/publication/351063772_LVI-SAM_Tightly-coupled_Lidar-Visual-Inertial_Odometry_via_Smoothing_and_Mapping
- LB-LIOSAM: an improved mapping and localization method with loop detection, https://www.researchgate.net/publication/385940673_LB-LIOSAM_an_improved_mapping_and_localization_method_with_loop_detection
- LIO-CSI: LiDAR inertial odometry with loop closure combined with semantic information, https://pmc.ncbi.nlm.nih.gov/articles/PMC8654169/
- LiDAR Inertial Odometry Based on Indexed Point and Delayed Removal Strategy in Highly Dynamic Environments - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC10255994/
- LiDAR-Inertial Odometry in Dynamic Driving Scenarios using Label Consistency Detection, https://arxiv.org/html/2407.03590v2
- Direct LiDAR-Inertial Odometry: Lightweight LIO with Continuous-Time Motion Correction | Request PDF - ResearchGate, https://www.researchgate.net/publication/359106820_Direct_LiDAR-Inertial_Odometry_Lightweight_LIO_with_Continuous-Time_Motion_Correction